在现实世界中,非确定性测量很常见:随机优化算法的性能或在混乱环境中加强学习代理人的总奖励只是两个例子,其中不可预测的结果很常见。这些度量可以建模为随机变量,并通过其预期值或更复杂的工具(例如原假设统计检验)相互比较。在本文中,我们提出了一个替代框架,以根据估计的累积分布函数在视觉上比较两个样本。首先,我们为两个随机变量引入了一个优势度量,该变量量化了一个随机变量之一的累积分布函数学术上主导另一个变量的比例。然后,我们提出了一种在分位数中分解的图形方法i)提出的优势度量和ii)一个随机变量之一比另一个变量较低的值的概率。出于说明性目的,我们通过提出的方法重新评估了已经发表的工作的实验,我们表明可以推断出其他结论(通过其余方法错过)。此外,将软件包rvCompare创建为应用和实验建议的框架的一种方便方法。
translated by 谷歌翻译